iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 2
0
自我挑戰組

資料分析之路的雜談系列 第 2

AI的技術限制

  • 分享至 

  • xImage
  •  

前一章節說明目前AI已經做到或正在進行中的項目,這章節會說明AI是否能夠完全模仿人類,藉由了解目前AI技術的極限,從而找出其他可能開拓的路徑。

AI做得到、做不到的事

AI的代名詞類神經網路早在十幾年就已被發明出來,期間歷經幾次寒冬到現在因運算速度的提升才重新火紅起來,這也代表目前使用的演算法是過去早已發明的,因為那時電腦跑一次程式需要大量時間,以至於這些演算法有好一陣子被研究者所摒棄,幸虧一些不放棄的學者持續改進算法加上科技進步,在近年才重新站上舞台。

因媒體的報導、企業領導者的大肆吹捧,AI看似能夠模仿人類做到所有事情,但實際在領域中的研究者都知道,之所以AI學習能力相較已往能夠大幅提升是因為現在的機器足以計算更大量級資料,當資料量接近母體數時,以AI動輒幾百幾千萬的參數數量,甚至將整體資料背下來都不無可能,也因此AI的學習能力才能達到更高準度。

AI能夠完全模仿人類嗎

當類神經還在寒冬時代時,有個叫做支持向量機SVM的發明幾乎稱霸資料分析界,模型簡單易懂的概念且有大量的數學理論支撐,各大學術論文經常能夠看到它的身影,但SVM就如同其他傳統演算法一樣,需要人工從訓練資料擷取出特徵進行分析,因此誰能想到更多有效的特徵就能擁有更高的準確度,然而這種人工擷取特徵模式到了2013年因類神經的發展發生了改變。

2013年 Tomas Mikolov發明了word vector representation learning方法,這是一種表達文字的方式,它能夠根據字詞上下文自動學出適當的向量來代表每個字詞,意義相似字詞的向量距離相近,反之則遠。原先是以學習word vector representation為主要,後來學者將這套學習法擴展到everything representation learning,幾乎各種資料都能向量化,這種能夠自動根據資料特性而學習出相對應特徵的能力,與傳統模型產生了巨大差異性,這代表不再需要人工擷取特徵,模型會幫我們自動學習出特徵來,效果甚至能夠超越人工特徵。

有一句話是這麼說「 特徵的選取決定了機器學習的上限,模型(Model)只是逼近這個上限」,因此自動特徵學習聽起來好像解決資料分析中最困難的問題,只要讓模型自動學到最好的特徵,就能夠讓準確度達到最高。然而事實情況是,模型還無法學習到最好特徵,原因在於目前的類神經架構都是模仿人類學習方式而搭建出來,像是增強式學習是透過獎勵機制如小孩子做對動作就給予棒棒糖那樣,讓電腦做我們希望電腦執行的動作,而另一個類神經常用的注意力機制,則是模仿人類在做動作時會將注意力放在重要事物上,而執行相對應動作。

通常我們必須設計各種機制加到類神經中,模型才能夠擁有如人類學習能力,但我們無法設計出無限的機制給類神經使用,如同我們無法以人工擷取出無限特徵進行模型訓練。在過去我們人工設計資料特徵,到現在我們其實還是在人工設計特徵,只是設計的不再是資料特徵,而是模型特徵,最終我們還是回到原點,一樣需要人工擷取特徵,只是我們擷取不完。

Reference

1. 停止对人类的迷恋!AI完全模仿人类大脑是在浪费时间


上一篇
資料分析雜談的開始
下一篇
百變怪AI
系列文
資料分析之路的雜談30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言